检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 融合卷积注意力机制的图像描述生成模型

黄友文, 游亚东, 赵朋

计算机应用 2020, 40 (1): 23-27. DOI: 10.11772/j.issn.1001-9081.2019050943

摘要（422）

PDF （810KB）（514）

图像描述模型需要提取出图像中的特征，然后通过自然语言处理（NLP）技术将特征用语句表达出来。现有的基于卷积神经网络（CNN）和循环神经网络（RNN）搭建的图像描述模型在提取图像关键信息时精度不高且训练速度缓慢。针对这个问题，提出了一种基于卷积注意力机制和长短期记忆（LSTM）网络的图像描述生成模型。采用Inception-ResNet-V2作为特征提取网络，在注意力机制中引入全卷积操作替代传统的全连接操作，减少了模型参数的数量。将图像特征与文本特征有效融合后送入LSTM单元中完成训练，最终产生描述图像内容的语义信息。模型采用MSCOCO数据集进行训练，使用多种评价指标（BLEU-1、BLEU-4、METEOR、CIDEr等）对模型进行验证。实验结果表明，提出的模型能够对图像内容进行准确描述，在多种评价指标上均优于基于传统注意力机制的方法。

参考文献 | 相关文章 | 多维度评价

Select

2. AVS解码器流水线控制机制的一种改进设计

黄友文

计算机应用 2009, 29 (11): 3135-3138.

摘要（1378）

PDF （981KB）（1155）

根据AVS视频标准中的解码算法特点,提出一种改进的AVS解码器流水线控制机制。该流水线对解码模块采用两级控制策略，不同级别流水线中的解码模块数据处理粒度不同，节省了级间缓存。同时，合理安排数据处理顺序，减少了数据等待时间。仿真结果表明，该设计在不影响系统解码性能的基础上节省了大量的存储器资源。